Red de Atención con Reservorio: Memoria entre pasadas en Transformers Descubre cómo la Red de Atención con Reservorio inyecta un reservorio fijo en Transformers preentrenados para mantener estado entre pases, usando solo una GPU 2026-06-16 · 2 min